Sesión 2: Visualización de datos con ggplot2

Curso: Introducción al software R para Ciencia de Datos en Salud
XXXVI CCN Huancayo - SOCIMEP 2022

Percy Soto-Becerra M.D., M.Sc(c)

Investigador Externo, Universidad Continental, Huancayo
@github/psotob91

Agosto 11, 2022

Visualización de datos

Visualización de datos


“The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey

  • La visualización de datos es la creación y el estudio de la representación visual de los datos.

  • Muchas herramientas para visualizar datos, R es una de ellas.

  • Muchos enfoques/sistemas dentro de R para hacer visualizaciones de datos

    • ggplot2 es uno de ellos, y eso es lo que vamos a usar

{ggplot2} es un paquete de {tidyverse}

  • ggplot2 es el paquete de visualización de datos de tidyverse.

  • gg en ggplot2 significa Gramática de gráficos.

  • Inspirado en el libro Grammar of Graphics de Leland Wilkinson

Gramática de gráficos

  • Una gramática de gráficos es una herramienta que nos permite describir de manera concisa los componentes de un gráfico.

Primeros pasos con ggplot2

Aspectos básicos de ggplot2


  • Estructura de código para generar gráficos en ggplot2
ggplot(data = [dataset], 
       mapping = aes(x = [x-variable], 
                     y = [y-variable])) +
   geom_xxx() +
   other options

Datos: gapminder

  • Data disponible en paquete {dslabs}.


library(dslabs)
data(gapminder, package = "dslabs") 


  • Veamos un resmen de estos datos:
head(gapminder)
              country year infant_mortality life_expectancy fertility
1             Albania 1960           115.40           62.87      6.19
2             Algeria 1960           148.20           47.50      7.65
3              Angola 1960           208.00           35.98      7.32
4 Antigua and Barbuda 1960               NA           62.97      4.43
5           Argentina 1960            59.87           65.39      3.11
6             Armenia 1960               NA           66.86      4.55
  population          gdp continent          region
1    1636054           NA    Europe Southern Europe
2   11124892  13828152297    Africa Northern Africa
3    5270844           NA    Africa   Middle Africa
4      54681           NA  Americas       Caribbean
5   20619075 108322326649  Americas   South America
6    1867396           NA      Asia    Western Asia


  • Veamos el detalle
?gapminder

Código paso a paso

Inicia con el data.frame gapminder

ggplot(data = gapminder)

Inicia con el data.frame gapminder, [mapea ]

ggplot(data = gapminder, 
       mapping = aes(x = population))

Nombre de argumentos

Eséticas

Opciones de estéticas

Color

Forma

Tamaño

Alfa

Mapping vs. Setting

Faceting

Faceting

Varias formas de faceting

Faceting summary

X






Preguntas?





Muchas gracias!